ارائه روشی جهت بهبود تشخیص صفحات فریب آمیز در گراف وب فارسی

پایان نامه
چکیده

امروزه با افزایش چشمگیر استفاده از اینترنت و همچنین رشد بسیار فزاینده صفحات وب، استفاده از موتورهای جستجو اهمیت بیشتری پیدا کرده است. در نتیجه بعضی از افراد برای بدست آوردن مخاطب بیشتر و در نتیجه سود بیشتر تلاش می کنند موتورهای جستجو را گمراه کنند و رتبه صفحات مورد نظر خود را با روش های نامشروع بالا ببرند. شناسایی این صفحات (که به آنها صفحات فریبکار می گویند) می تواند نقشی اساسی در بهبود عملکرد موتورهای جستجو و بالا بردن اطمینان کاربران به آنها گردد. وب فریبکارانه پدیده ای است که پیدایش آن همزمان با ظهور وب بوده و در سا ل های اخیر بسیار شایع شده است. روش های مختلفی برای تولید صفحات فریب آمیز مورد استفاده قرار می¬گیرند اما همیشه با توجه به الگوریتم¬هایی که موتورهای جستجو برای رتبه¬بندی صفحات وب به کار می برند ترفندهای جدید فریبکاری ابداع می شود. فریبگرها از دو روش کلی فریبکاری مبتنی بر محتوا و فریبکاری مبتنی بر پیوند برای فریب موتورهای جستجو استفاده می کنند. در این پایان نامه ابتدا به معرفی روش ها و الگوریتم های مختلف تشخیص صفحات وب فریب آمیز می پردازیم. در نهایت روشی جدید جهت شناسایی صفحات فریب آمیز در گراف وب فارسی ارائه می گردد. این روش ترکیبی از روش های مبتنی بر محتوا و پیوند است و با بهره گیری از اطلاعات محتوا و پیوند، صفحات فریب آمیز را شناسایی می کند. این روش بر روی داده های موتور جستجوی فارسی پارسی جو پیاده سازی شده است و نتایج ارزیابی های صورت گرفته قبل از پیاده سازی این الگوریتم و پس از آن بهبودی برابر با 21.2% را در فاکتور دقت نشان می دهد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

رتیه بندی هوشمند گراف وب برای مقابله با صفحات فریب آمیز

با گسترش روزافزون وب در سالهای اخیر و کاربرد های آن در همه زمینه ها از جمله تجارت الکترونیک، بازرگانی و اجتماعی و همچنین با بالا رفتن پتانسیل سود در وب، اکثر توسعه دهندگان صفحات به فکر بازدیدکننده بیشتر از سایت ها هستند. در این میان تشخیص محتوای با کیفیت از تلاش های فریب کارانه جهت به بازی گرفتن موتورهای جستجو به یکی از چالش های اصلی این موتورها تبدیل شده است. تاکنون الگوریتم های مختلفی برای مق...

15 صفحه اول

ارائه روشی جهت ارزیابی صحت عملکرد کیت تشخیص انتروباکتریاسه

یکی از مهمتین گروه های باکتری گرم منفی، خانواده انتروباکتریاسه است که به منظور تشخیص آن آز روش های مختلفی نظیر تست های لوله ای و همچنین روش های نوین آزمایشگاهی این امر محقق می شود. با این وجود، با توجه به مشکلاتی روش های سنتی کشت لوله ای همچون هزینه نیروی انسانی، مالی و زمانی که برای آماده سازی محیط کشت، آلودگی های میکروبی، دشواری ساخت محیط های کشت مختلف و ... استفاده از روش های نوین آزمایشگ...

متن کامل

ارائه روشی برای پیش‌پردازش تصویر جهت بهبود عملکرد JPEG

A lot of researchs have been performed in image compression and different methods have been proposed. Each of the existing methods presents different compression rates on various images. By identifing the effective parameters in a compression algorithm and strengthen them in the preprocessing stage, the compression rate of the algorithm can be improved. JPEG is one of the successful compression...

متن کامل

بهینه سازی هسته های چندگانه در ماشین بردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریب آمیز

چکیده: موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخص گذاری آن ها، قابلیت جستجوی سریع اطلاعات را به کاربران می دهند. یکی از چالش های مهم در استفاده از این ابزار، صفحاتی هستند که از آن ها به عنوان صفحات فریب آمیز نام برده می شود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع شده است که می توان به روش هایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از روش ...

متن کامل

ارائه روشی برای پیش پردازش تصویر جهت بهبود عملکرد jpeg

تاکنون کارهای زیادی در مورد فشرده سازی تصویر انجام گرفته و روش­های متفاوتی ارائه شده­اند. هر یک از این روش­ها بر روی تصاویر مختلف، میزان فشرده­سازی متفاوتی را ارائه می­دهند. با شناسایی پارامترهای تاثیرگذار در یک الگوریتم فشرده­سازی و تقویت آنها در مرحله پیش‎پردازش، میزان فشرده­سازی آن الگوریتم را می­توان بهبود بخشید. jpeg یکی از روش­های فشرده­سازی موفق می­باشد که کارهای زیادی نیز برای بهبود عمل...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023